智能论文笔记

BERT-based Ensemble Approaches for Hate Speech Detection

Khouloud Mnassri , Praboda Rajapaksha , Reza Farahbakhsh , Noel Crespi

分类：自然语言处理 | 机器学习

2022-09-14

随着在线社交媒体提供的沟通自由，仇恨言论越来越多地产生。这导致网络冲突影响个人和国家一级的社会生活。结果，在发送到社交网络之前，仇恨的内容分类越来越需要过滤仇恨内容。本文着重于使用多个深层模型在社交媒体中对仇恨言论进行分类，这些模型通过整合了最近的基于变压器的语言模型，例如BERT和神经网络。为了改善分类性能，我们通过几种合奏技术进行了评估，包括软投票，最大价值，硬投票和堆叠。我们使用了三个公开可用的Twitter数据集（Davidson，Hateval2019，OLID）来识别进攻性语言。我们融合了所有这些数据集以生成单个数据集（DHO数据集），该数据集在不同的标签上更加平衡，以执行多标签分类。我们的实验已在Davidson数据集和Dho Corpora上举行。后来给出了最佳的总体结果，尤其是F1宏观分数，即使它需要更多的资源（时间执行和内存）。实验显示了良好的结果，尤其是整体模型，其中堆叠在Davidson数据集上的F1得分为97％，并且在DHO数据集上汇总合奏的77％。

translated by 谷歌翻译

Annual field-scale maps of tall and short crops at the global scale using GEDI and Sentinel-2

Stefania Di Tommaso , Sherrie Wang , Vivek Vajipey , Noel Gorelick , Rob Strey , David B. Lobell

分类：计算机视觉 | 机器学习

2022-12-19

Crop type maps are critical for tracking agricultural land use and estimating crop production. Remote sensing has proven an efficient and reliable tool for creating these maps in regions with abundant ground labels for model training, yet these labels remain difficult to obtain in many regions and years. NASA's Global Ecosystem Dynamics Investigation (GEDI) spaceborne lidar instrument, originally designed for forest monitoring, has shown promise for distinguishing tall and short crops. In the current study, we leverage GEDI to develop wall-to-wall maps of short vs tall crops on a global scale at 10 m resolution for 2019-2021. Specifically, we show that (1) GEDI returns can reliably be classified into tall and short crops after removing shots with extreme view angles or topographic slope, (2) the frequency of tall crops over time can be used to identify months when tall crops are at their peak height, and (3) GEDI shots in these months can then be used to train random forest models that use Sentinel-2 time series to accurately predict short vs. tall crops. Independent reference data from around the world are then used to evaluate these GEDI-S2 maps. We find that GEDI-S2 performed nearly as well as models trained on thousands of local reference training points, with accuracies of at least 87% and often above 90% throughout the Americas, Europe, and East Asia. Systematic underestimation of tall crop area was observed in regions where crops frequently exhibit low biomass, namely Africa and South Asia, and further work is needed in these systems. Although the GEDI-S2 approach only differentiates tall from short crops, in many landscapes this distinction goes a long way toward mapping the main individual crop types. The combination of GEDI and Sentinel-2 thus presents a very promising path towards global crop mapping with minimal reliance on ground data.

translated by 谷歌翻译

Safe machine learning model release from Trusted Research Environments: The AI-SDC package

Jim Smith , Richard Preen , Andrew McCarthy , Alba Crespi Boixander , James Liley , Simon Rogers

分类：机器学习

2022-12-02

We present AI-SDC, an integrated suite of open source Python tools to facilitate Statistical Disclosure Control (SDC) of Machine Learning (ML) models trained on confidential data prior to public release. AI-SDC combines (i) a SafeModel package that extends commonly used ML models to provide ante-hoc SDC by assessing the vulnerability of disclosure posed by the training regime; and (ii) an Attacks package that provides post-hoc SDC by rigorously assessing the empirical disclosure risk of a model through a variety of simulated attacks after training. The AI-SDC code and documentation are available under an MIT license at https://github.com/AI-SDC/AI-SDC.

translated by 谷歌翻译

Nonlinear Model Predictive Control of a 3D Hopping Robot: Leveraging Lie Group Integrators for Dynamically Stable Behaviors

Noel Csomay-Shanklin , Victor D. Dorobantu , Aaron D. Ames

分类：机器人

2022-09-23

在充满活力的腿部运动领域，实现稳定的跳跃一直是一个标志性的挑战。由于长期不足，因此，受控跳跃非常困难，加上非常短的地面阶段，必须调节地面相互作用以调节全球状态。在这项工作中，我们探讨了混合非线性模型预测控制的使用，并与多速率层次结构中的低级反馈控制器配对，以在新颖的3D跳架机器人上实现动态稳定的运动。为了在旋转的多种状态上展示更丰富的行为，规划和反馈层都必须以几何一致的方式完成。因此，我们开发了采用谎言组集成商和适当的反馈控制器的必要工具。我们在实验上证明了在新型机器人上稳定的3D跳，以及模拟中的轨迹跟踪和翻转。

translated by 谷歌翻译

Robust Bipedal Locomotion: Leveraging Saltation Matrices for Gait Optimization

Maegan Tucker , Noel Csomay-Shanklin , Aaron D. Ames

分类：机器人

2022-09-21

在双皮德机器人上生成健壮步态的能力是他们在硬件上成功实现的关键。为此，这项工作扩展了混合零动力学（HZD）的方法 - 传统上，该方法仅在完美影响事件下通过周期性限制来说明机车稳定性 - 通过包含盐矩阵，以构成合成强大的步行步态的观点。通过共同将扩展盐矩阵的规范和步态生成过程中的机器人的扭矩最小化，我们表明合成的步态比单独使用任何一个术语产生的步态更强大。这些结果在模拟和硬件中显示了琥珀色3M平面和阿塔兰特较低体外外骨骼（无论有没有人类）。最终结果是实验验证，即将盐矩阵与HZD方法相结合，在实践中会产生更健壮的两足步行。

translated by 谷歌翻译

Cardiac Segmentation using Transfer Learning under Respiratory Motion Artifacts

Carles Garcia-Cabrera , Eric Arazo , Kathleen M. Curran , Noel E. O'Connor , Kevin McGuinness

分类：计算机视觉

2022-09-20

对心脏磁共振成像（MRI）进行心室分割时具有弹性的方法，对于确保对这些组织的结构和功能分析的质量至关重要。尽管在提高算法的质量方面做出了重大努力，但很少有作品能够应对伪像在预测中产生的危害。在这项工作中，我们研究了经过验证的网络的微调，以提高以前方法对这些工件的弹性。在我们提出的方法中，我们采用了模仿这些人工制品的数据增强的广泛使用。结果显着改善了基线分割（最高0.06个骰子得分和4mm的Hausdorff距离提高）。

translated by 谷歌翻译

Towards advanced robotic manipulation

Francisco Roldan Sanchez , Stephen Redmond , Kevin McGuinness , Noel O'Connor

分类：机器人

2022-09-19

近年来，机器人的操纵和控制的重要性增加了。但是，在现实世界应用中需要操作时，最新技术仍然存在局限性。本文探讨了在模拟环境和真实环境中重播的事后观看经验，突出了其弱点，并根据奖励和目标塑造提出了基于加强学习的替代方案。此外，还发现了一些研究问题以及可以探索以解决这些问题的潜在研究方向。

translated by 谷歌翻译

Energy Shaping Control of a Muscular Octopus Arm Moving in Three Dimensions

Heng-Sheng Chang , Udit Halder , Chia-Hsien Shih , Noel Naughton , Mattia Gazzola , Prashant G. Mehta

分类：机器人

2022-09-09

柔性章鱼臂具有卓越的能力，可以协调大量自由度并执行复杂的操纵任务。结果，这些系统继续吸引生物学家和机器人的注意力。在本文中，我们开发了一个三维模型的软章鱼臂，配备了生物力学上逼真的肌肉致动。考虑了所有主要肌肉群施加的内力和夫妇。描述了一种能量塑形控制方法来协调肌肉活动，以便在3D空间中掌握和触及。本文的主要贡献是：（i）主要肌肉群建模以引起三维运动；（ii）基于存储的能量功能的肌肉激活的数学公式；（iii）通过在特殊欧几里得组SE中解决优化问题获得的设计特定于任务的平衡配置的计算有效过程（3）。然后，根据优化问题解决方案引起的共同状态变量，对肌肉控制进行迭代计算。该方法在物理准确的软件环境弹性中得到了数值的证明。报告了模拟观察到的章鱼行为的数值实验的结果。

translated by 谷歌翻译

Constraining Representations Yields Models That Know What They Don't Know

Joao Monteiro , Pau Rodriguez , Pierre-Andre Noel , Issam Laradji , David Vazquez

分类：机器学习 | 人工智能 | 计算机视觉

2022-08-30

神经网络的一种众所周知的故障模式对应于高置信度错误的预测，尤其是对于训练分布有所不同的数据。这种不安全的行为限制了其适用性。为此，我们表明可以通过在其内部表示中添加约束来定义提供准确置信度的模型。也就是说，我们将类标签编码为固定的唯一二进制向量或类代码，并使用这些标签来在整个模型中强制执行依赖类的激活模式。结果预测因子被称为总激活分类器（TAC），而TAC用作基础分类器的附加组件，以指示预测的可靠性。给定数据实例，TAC切片中间表示分为不相交集，并将此类切片减少到标量中，从而产生激活曲线。在培训期间，将激活轮廓推向分配给给定培训实例的代码。在测试时，可以预测与最匹配示例激活曲线的代码相对应的类。从经验上讲，我们观察到激活模式及其相应代码之间的相似之处导致一种廉价的无监督方法来诱导歧视性置信度得分。也就是说，我们表明TAC至少与从现有模型中提取的最新置信度得分一样好，同时严格改善了模型在拒绝设置上的价值。还观察到TAC在多种类型的架构和数据模式上都很好地工作。

translated by 谷歌翻译

Learning Visual Representation from Modality-Shared Contrastive Language-Image Pre-training

Haoxuan You , Luowei Zhou , Bin Xiao , Noel Codella , Yu Cheng , Ruochen Xu , Shih-Fu Chang , Lu Yuan

分类：计算机视觉 | 自然语言处理

2022-07-26

大规模的多模式对比预训练已经证明了通过将多种模式映射到共享嵌入空间中的一系列下游任务的可转移功能。通常，这对每种模式都采用了单独的编码器。但是，最近的工作表明，变形金刚可以支持跨多种方式学习并允许知识共享。受此启发，我们研究了各种模式共享的对比语言图像预训练（MS-CLIP）框架。更具体地说，我们质疑在对比预训练期间可以在跨模态共享变压器模型的多少个参数，并严格检查建筑设计选择，以将沿频谱共享的参数比例定位。在研究的条件下，我们观察到，视觉和语言信号的主要统一编码器优于所有其他分离更多参数的变体。此外，我们发现特定于特定于模态的平行模块进一步提高了性能。实验结果表明，所提出的MS-CLIP方法在零摄像机分类中（在YFCC-100M上进行了预训练）中，最多可超过13 \％相对的香草夹，同时支持降低参数。此外，在24个下游视觉任务的集合中，我们的方法在线性探测中优于Vanilla剪辑。此外，我们发现共享参数导致语义概念来自不同方式在嵌入空间中更接近地编码，从而促进了共同的语义结构（例如注意力模式）从语言到视觉的传递。代码可在\ href {https://github.com/hxyou/msclip} {url}中获得。

translated by 谷歌翻译